Extraktion von semantischen Relationen aus natürlichsprachlichem Text mit Hilfe von maschinellem Lernen
نویسنده
چکیده
Zusammenfassung: Inhalt der vorliegenden Arbeit ist die Entwicklung eines Lernverfahrens, das aus großen Textkorpora semantische Relationen automatisch extrahiert. Den Kern des Verfahrens bildet die Iteration von Suchschritt und Verifikationsschritt, in denen in gesuchter Relation stehende Wörter gefunden und überprüft werden. Auf diese Weise ist es möglich, mit wenigen bekannten Wörtern eine große Anzahl in derselben Relation stehende Wörter zu gewinnen. So können mit wenig Aufwand große Listen von Wörtern erstellt werden, die in einem semantischen Zusammenhang stehen. Nach der Skizzierung des Algorithmus werden theoretische Vorhersagen bezüglich der für das Verfahren geeigneten Relationen getroffen, sowie der Ablauf modelliert. Einige mit einer Implementierung des Verfahrens erzielte Ergebnisse werden für die Relation der Personennamen vorgestellt, evaluiert und diskutiert, des Weiteren werden Ausblicke und Verbesserungsmöglichkeiten angegeben.
منابع مشابه
Fachdatenbanken und Internetquellen: Rechercheüberstieg durch Anfragetransfer
Die Sonderfördermaßnahme CARMEN zielte unter anderem darauf ab, die Erweiterung von Recherchen in bibliographischen Fachdatenbanken ins Internet zu verbessern. Dabei war das Problem der semantischen Heterogenität zu behandeln, die durch unterschiedliche Inhaltserschließung in verschiedenen Datenbeständen auftritt. Dazu wurden verschiedene Ansätze wie Metadatenextraktion aus Internetquellen und ...
متن کاملGenerierung und Anfragebearbeitung von hierarchischen XML-Sichten auf relationale Datenbanken
In diesem Beitrag wird beschrieben, wie aus einem relationalen Datenbankschema äquivalente XML-Dokumentbeschreibungen in XMLSchema generiert werden können, die implizite hierarchische Strukturen aus der Datenbank möglichst explizit darstellen. Dabei wird ausgenutzt, dass Primärund Fremdschlüssel sowie Eindeutigkeitsund Nullwert-Bedingungen in XMLSchema übernommen und dass Datentypen des Datenba...
متن کاملGenerierung semantischer Felder auf der Basis von Frei-Texten
den Anspruch, genau die gleichen Head/ModifierRelationen automatisch zu finden, wie durch menschliche Intuition. Auf die RelationenTypes bezogen müßte die Fehlerrate wesentlich kleiner sein, wenn nur die häufigen Head/Modifier-Relationen berücksichtigt werden. Die Behandlung der Konjunktionsrelationen (s. Abb. 3) wurden ebenfalls zum Zweck der Phrasennormalisierung entwickelt. Bei der Extraktio...
متن کاملAutomatische Extraktion von Fachterminologie aus kunst-historischen Volltexten
Mit Hilfe eines algorithmisch arbeitenden Verfahrens können fachterminologische Mehrwortgruppen aus elektronisch vorliegenden Texten identifiziert und extrahiert werden. Inhaltlicher Schwerpunkt stellt die Einbindung von Funktionswörtern des deutschen Sprachgebrauchs in den Extraktionsalgorithmus dar. Als Datengrundlage dieser Arbeit dienten kunsthistorische Lexikonartikel des Reallexikons zur ...
متن کاملRäumliche Inferenz mit Lern- und Optimierungsverfahren
In der Dissertation „Anwendung von Verfahren des Maschinellen Lernens und von Evolutionären Algorithmen bei der räumlichen Inferenz“ [2] werden verschiedene Ansätze zum Lösen der bei dem verwendeten metrischen Ansatz zur räumlichen Inferenz entstehenden Constraintsysteme vorgestellt und verglichen. Neben aktuellen ConstraintsolvingAlgorithmen wurden Verfahren aus den Bereichen Maschinelles Lern...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- LDV Forum
دوره 18 شماره
صفحات -
تاریخ انتشار 2003